Machine Learning Foundations - L3 Notes(上)

前言

章節名稱: types of learning

特別提醒一下，這個章節的很多名詞都可以去 Google 或維基百科，可以得到更多有用的資訊！
機器學習右側。

從機器輸出 $y$ 的類型來說明不同種的問題。

3-1-2

Binary Classification (二元分類): 也就是是非題
Multiclass Classification (多元分類): 可以看成選擇題，輸出可能有 K 種(二元分類 K = 2)，例如:郵件分類、辨別圖片上的水果、銅板分類。
Regression (迴歸分析): 其輸出為實數空間，或某個實數範圍(bounded regression)，例如:股票價格預測、天氣預測。
Structured Learning (Structured prediction): 舉例來說，將給定的句子當作輸入，分析每個詞的詞性，而因為所在位置或語意的不同，同樣的詞可能會有不同詞性。可把它看成一個很大的多元分類，底下的類別有某種結構上的關係。
還有例如:蛋白質的分析，其構造哪邊彎哪邊折會有不同影響。

3-1-1

從 Data 中的 $x_n$ 有沒有相對應的 $y_n$ ，來區別不同的學習。

Supervised Learning (監督式學習): 資料中，對於給定的輸入 ($x_n$)，有給予相對應的輸出 ($y_n$)。

是一個機器學習中的方法，可以由訓練資料中學到或建立一個模式（函數 / learning model），並依此模式推測新的實例。訓練資料是由輸入物件（通常是向量）和預期輸出所組成。 - 維基百科
Unsupervised Learning (非監督式學習): 資料中不給予其類別，不曉得哪一個輸入是屬於哪一個類別。Cluster 是一個常見的 Unsupervised Learning。
維基百科

Unsupervised Learning 資料中沒有 $y_n$ ，我們想要學到淺藏在下的 $y_n$ ，例如其機率函數，
以下是一些 Unsupervised Learning 的例子:

3-2-1

相較之下 監督式學習 有較固定的標記與目標， 非監督式學習 的目標則比較分散，也就較難衡量其演算法的好壞。

而介於這兩者之中的是 :

Semi-supervised(半監督式學習) : 少部分已分好的標籤($y_n$)加上還沒有分類好的，兩者混再一起來做學習。對於替資料標記，可能需要很高的成本，對此我們可能就會替部分資料標記，來使用半監督式學習。

可以看一下此投影片的三個統計圖:

3-2-2

這邊舉了小狗的例子，當我們對它命令坐下 ($x_n$) ，牠不一定會乖乖聽話，說不定會有別的行為 ($y_n$)，此時我們做的反應則是依據小狗的回應來給予相應的懲罰(不好) 或獎勵(好)。(不一定非坐下就給予懲罰)

這種方法稱作: Reinforcement Learning 強化學習 or 增強式學習。

這邊舉了兩個例子:

與前面學習方法的差別，大致上是我們靠的並不是 很直接 的輸出資訊，而是另外一個輸出和其好壞來進行學習的動作。而通常這種學習的動作會序列的發生，也就是一筆一筆的進行。

3-2-3

不一定是完全正確、最期待的輸出，我們或許還是會給予獎勵。

3-2-4

我們總共提了4種不同的學習方式，而這些的核心是 Supervised Learning。

3-2-5